AI资讯新闻榜单内容搜索-LLaMA

最强开源大模型一夜易主

阿里云发布最强开源大模型Qwen2，干翻Llama 3，比闭源模型还强。

来自主题: AI技术研报

10638 点击 2024-06-09 11:06

开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

开源大模型全球格局，一夜再变。

来自主题: AI技术研报

10381 点击 2024-06-08 19:56

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。

来自主题: AI技术研报

10391 点击 2024-06-04 17:45

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了，清华系团队发文回应

面壁智能回应：“深表遗憾”，这也是一种“受到国际团队认可的方式”。

来自主题: AI资讯

11175 点击 2024-06-04 10:43

斯坦福AI团队“套壳”清华系开源大模型被实锤，被揭穿后全网删库跑路

大模型抄袭丑闻总是不断。

来自主题: AI资讯

11135 点击 2024-06-04 10:01

活体脑细胞做成16核芯片，用Python就能编程，9个机构开展实验36所大学排队

首个“脑PU”来了！由“16核”类人脑器官（human brain organoids）组成。

来自主题: AI技术研报

10545 点击 2024-06-03 11:12

LLM的「母语」是什么？

在以英语为主的语料库上训练的多语言LLM，是否使用英语作为内部语言？对此，来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报

10569 点击 2024-06-03 10:53

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10994 点击 2024-06-02 14:42

速度秒掉GPT-4o、22B击败Llama 3 70B，Mistral AI开放首个代码模型

开放但禁止商用用途。

来自主题: AI资讯

10393 点击 2024-05-30 20:20

32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

每个token只需要5.28%的算力，精度就能全面对标Llama 3。

来自主题: AI技术研报

11607 点击 2024-05-30 15:51